5 research outputs found

    Descrição, classificação e processamento automático das construções com o verbo 'dar' em português brasileiro

    Get PDF
    The Apendice_A.xlsx file is the table of properties of the predicational nouns described in the thesis.This PhD thesis starts from the observation of constructions with the verb 'dar' ('give') in Brazilian Portuguese and it proposes an analysis and classification of these constructions. The analysis of all constructions found in corpus is systematic and consistent, based on Transformational Grammar (HARRIS, 1964) and on the Lexicon-Grammar approach (GROSS, 1975; GROSS, 1981). Both theories adopt formal and experimental criteria to make reproducible the identification of base sentences and the classification of constructions with the verb 'dar'. The classification is based on structural and syntactic properties, leading to four classes or categories: (i) full verb or distributional verb, from which 8 verbal senses could be identified; (ii) causative operator verb, whose constructions could be subclassified in 4 groups, depending on the semantic type of the predicative noun; (iii) the verb as a fixed element, in idioms or in proverbs; and (iv) support verb, which is selected by a predicational noun. The first part of this thesis analyzes the constructions with the verb 'dar' as a full verb, as a causative operator verb and as a fixed verb. The second part of this thesis describes the support verb constructions (SVC), which are formed by the support verb 'dar' (Vsup) and the predicational noun (Npred). This description is extensive, considering all the occurrences in the corpus adopted and identifying the main formal, distributional and transformational SVC properties. These properties were described and formalized in a Lexicon-Grammar table, which is a binary matrix: each line corresponds to a lexical entry (Npred) and each column corresponds to a syntactic property of the construction. In the intersection between each line and each column, we marked by the sign “+” or “-” if the property is verified or not. The third part of the thesis presents an automatic syntactic analysis of SVCs, by using an approach based on dependency rules between their constituents. The rules are automatically generated from the L-G matrix data and, then, those rules are used by the parser in order to extract the dependency between the Npred and the Vsup. Thus, this work aims to advance the state of the art of the general verbal classification in Portuguese and Automatic Processing of Natural Languages, to contribute to the development of computational-lexical resources (the Lexicon-Grammar of nominal constructions) and to automatic parsing.Cette thèse part de l'observation des constructions à verbe "dar" ("donner") dans des corpus en portugais du Brésil. Elle en propose une analyse et une classification systématiques et cohérentes sur la base de la grammaire transformationnelle d'opérateurs (Harris, 1964, 1978) et du modèle théorico-méthodologique du lexique-grammaire (Gross, 1975, 1981). Les deux théories adoptent des critères formels/structurels et des procédés expérimentaux reproductibles pour identifier les phrases de base que nous adoptons pour la classification des constructions à verbe "dar". La classification de ces constructions se fonde sur leur structure et sur leurs propriétés syntaxiques. Quatre catégories ou types de constructions fondamentales où figure ce verbe ont été identifiées : (1) verbe plein (distributionnel), où sont identifiés 8 sens différents ; (2) verbe opérateur causatif ; (3) verbe élément d'une phrase figée, soit dans des expressions figées, soit dans des proverbes ; et (4) verbe support, un type particulier d'auxiliaire sélectionné par un nom prédicatif.La première partie de la thèse analyse les trois premiers types syntaxico-sémantiques du verbe "dar" : plein, causatif et figé. La deuxième partie analyse et décrit les constructions à verbe support (CVS) formées par le verbe support (VSup) "dar" et un nom prédicatif (Npred). Cette description est systématique et vise à recenser le plus possible de constructions dans les corpus et à identifier les principales propriétés formelles, distributionnelles et transformationnelles des CVS. Les propriétés sont formalisées au moyen d'une table de lexique-grammaire, c'est-à-dire une matrice de données qui représente de façon compacte les informations linguistiques pertinentes à la description de ces constructions. La troisième partie de la thèse présente une proposition d'analyse syntaxique automatique des CVS par une méthode fondée sur des règles de dépendance entre leurs constituants. Les règles sont produites automatiquement à partir des informations présentes dans la matrice de lexique-grammaire, puis utilisées par l'analyseur syntaxique automatique pour extraire une dépendance entre le Npred et le Vsup en identifiant la CVS. Ainsi, ce travail a pour but de faire progresser l'état de l'art de la classification générale des verbes en portugais et du traitement automatique des langues naturelles, en contribuant à la tâche d'analyse syntaxique automatique par le développement de ressources lexico-computationnelles (le lexique-grammaire des constructions nominales).Esta tese parte da observação das construções com o verbo "dar" em corpus em português brasileiro e propõe uma análise e classificação dessas construções, de forma sistemática e consistente, com base na Gramática Transformacional de operadores (HARRIS, 1964; HARRIS, 1978) e no modelo teórico-metodológico do Léxico-Gramática (GROSS, 1975; GROSS, 1981). Ambas as teorias adotam critérios formais/estruturais e procedimentos experimentais reprodutíveis para a identificação das frases de base e que adotamos para a classificação das construções com o verbo "dar". A classificação dessas construções foi baseada em suas estruturas e propriedades sintáticas, tendo sido identificadas quatro categorias ou tipos de construções fundamentais em que esse verbo ocorre: (i) verbo pleno (distribucional), de onde se identificam 8 sentidos diferentes; (ii) verbo-operador causativo; (iii) o verbo constituinte de uma frase fixa, seja em expressões cristalizadas seja em provérbios; e (iv) verbo-suporte, um tipo particular de auxiliar que é selecionado por um nome predicativo.A primeira parte da tese analisa os três primeiros tipos sintático-semânticos do verbo "dar" (pleno, causativo e fixo). A segunda parte da tese analisa e descreve as construções com verbo-suporte (CVS), formadas pelo verbo-suporte (Vsup) "dar" e um nome predicativo (Npred). Essa descrição é sistemática, buscando recensear o máximo possível de construções em corpus e identificando as principais propriedades formais, distribucionais e transformacionais das CVS. As propriedades são formalizadas por meio de uma matriz de dados, a qual representa de maneira compacta a informação linguística relevante para a descrição dessas construções. A terceira parte da tese apresenta uma proposta de análise sintática automática das CVS, usando uma abordagem baseada em regras de dependência entre seus constituintes. As regras são geradas automaticamente a partir das informações constantes na matriz do Léxico-Gramática e, em seguida, são usadas pelo analisador sintático automático para extrair uma dependência entre o Npred e o Vsup ao identificar a CVS. Assim, este trabalho objetiva avançar o estado da arte da classificação geral dos verbos em português e do Processamento Automático de Línguas Naturais, no sentido de contribuir com o desenvolvimento de recursos léxico-computacionais (o Léxico-Gramática das construções nominais) para a tarefa de análise sintática automática

    Do acontecimento histórico ao acontecimento discursivo: uma análise da “Marcha das vadias”

    Get PDF
    O presente trabalho discute a relação entre as noções de acontecimento histórico, acontecimento discursivo e acontecimento lingüístico no processo de constituição de sentidos da identidade feminina, a partir de práticas dos movimentos feministas e protestos contra a violência sexual sofrida por mulheres. Tomando como base um acontecimento histórico – a declaração feita por um policial e veiculada fortemente pela mídia, de que as mulheres são estupradas porque se vestem como vadias –, pretende-se delinear o percurso sócio-histórico que levou ao acontecimento discursivo chamado Marcha das Vadias. Assim como um acontecimento histórico pode gerar um acontecimento discursivo, este, por sua vez, também pode ser determinante para a ocorrência de um acontecimento lingüístico. As três noções de acontecimento se pautam na Teoria da Análise do Discurso de orientação francesa e são exploradas neste artigo, levando-se em conta sua relação com a atualização dos discursos,os efeitos de sentido pretendidos e produzidos pelos discursos, a produção e circulação dos discursos e a constituição da identidade feminina nesse panorama.FROM HISTORICAL EVENT TO DISCOURSIVE EVENT: AN ANALYSISOF “SLUTWALK”Abstract: This paper discusses the relation between the concepts of historical event, discursive event and linguistic event, in the constitution process of meanings of feminist identity, from practices of feminist movements and protests against sexual violence suffered by women. Based on a historical event – the statement made by a police officer and strongly conveyed by the media that women are raped because they dress like sluts – is intended to outlinethe socio-historical path that led to the discursive event called Slutwalk. As a historical event can generate a discursive event, this, in turn, can also be decisive for occurring a linguistic event. The three notions of event are guided in the French orientated Theory of Discourse Analysis and are explored in this article, considering its relationship with the speech revising, the effects of meaning intended and produced by the speeches, the production and circulation of discourse and the constitution of female identity in this perspectiv

    STATUS Syntactic-Semantic DO IN THE VERB WRITING PORTUGUESE BRAZIL

    No full text
    Made available in DSpace on 2014-07-29T16:19:11Z (GMT). No. of bitstreams: 1 Dissertacao_Amanda_Rassi.pdf: 367318 bytes, checksum: 011fda81788caa4476a86cec46bb6987 (MD5) Previous issue date: 2008-09-11This study proposes to examine the operation and uses of the verb to do in written texts the Portuguese of Brazil. The model adopted for the analysis is the Lexicon-Grammar (GROSS, 1975, 1981), under which all syntactic and semantic rules of a language can be described from their simple sentences. Theory of valences (Borba, 1996) recognizes the same principle, adding that there is a hierarchy among the constituents of the sentence and that in general, the central lexical item that selects every other element is the phrasal item lexical verb. Theories of the Lexicon-Grammar and provision, together with the notions of sign, meaning, value, text and gender, are the theoretical foundation of this research, both qualitative and quantitative, seeking not only the types of verb do, but, above all, their degree of recurrence in the corpus. The meanings and uses of the verb were taken to the texts that make up the Lazio-Ref, reference corpus Project Lazio-Web, organized and published by NILC USP (ALUÍSIO et al., 2004). Breaks, therefore, the assumption that all the Portuguese verbs undergo a continuum, ranging from full verb - which is the prototype - even a verb constituent expression crystallized, assuming as a verb support, vicarious, operator-causative, hiperverbo, among other classifications. To get to these classes and therefore the results, the analysis of the corpus followed the Transformational Model (Harris, 1964, 1968), applying transformational rules to simple phrases to determine their acceptability or unacceptability of the language. The analysis revealed recognize three interesting properties regarding the operation of the verb do in written Portuguese of Brazil: a) form is predominantly as a verb support, unlike many other verbs in Portuguese; b) classification is for a continuum and can not be described in terms of limit between one category and another, but in terms of boundaries, where two categories are mixed and interpose c) is one of the most productive verbs of the Portuguese language, which is explained by idea of linguistic struggling economy.Este trabalho propõe analisar o funcionamento e os usos do verbo fazer em textos escritos do português do Brasil. O modelo adotado para a análise é o do Léxico-Gramática (GROSS, 1975, 1981), segundo o qual todas as regras sintático-semânticas de uma língua podem ser descritas a partir de suas frases simples. A Teoria de valências (BORBA, 1996) reconhece o mesmo princípio, acrescentando que há uma hierarquia entre os constituintes da frase e que, em geral, o item lexical central que seleciona todos os outros elementos frasais é o item lexical verbal. As teorias do Léxico-Gramática e de valências, juntamente com as noções de signo, significado, valor, texto e gênero, constituem a fundamentação teórica desta pesquisa, ao mesmo tempo qualitativa e quantitativa, buscando não apenas os tipos de verbo fazer, mas, sobretudo, sua maior ou menor recorrência no corpus. As acepções e usos do verbo fazer foram retirados dos textos que compõem o Lacio-Ref, corpus de referência do Projeto Lacio-Web, organizado e publicado pelo NILC da USP (ALUISIO et al., 2004). Parte-se, portanto, do pressuposto de que todos os verbos do português passam por um continuum, que vai desde verbo pleno que é o mais prototípico até verbo constituinte de uma expressão cristalizada, admitindo-se como verbo suporte, vicário, operador-causativo, hiperverbo, dentre outras classificações. Para chegar a essas classes e, consequentemente, aos resultados, a análise do corpus seguiu o Modelo Transformacional (HARRIS, 1964, 1968), aplicando regras transformacionais às frases simples para verificar sua aceitabilidade ou inaceitabilidade na língua. A análise propiciou reconhecer três propriedades interessantes em relação ao funcionamento do verbo fazer em português escrito do Brasil: a) sua forma predominante é como verbo suporte, diferentemente de muitos outros verbos do português; b) sua classificação passa por um continuum, não podendo ser descrita em termos de limite entre uma categoria e outra, mas em termos de fronteiras, onde duas categorias se mesclam e interpõem; c) é um dos verbos mais produtivos da língua portuguesa, o que se explica pela idéia da economia do esforço lingüístico

    Tipologia das construções verbais em PB: uma proposta de classificação do verbo dar

    No full text
    Resumo: O presente artigo apresenta uma proposta de classificação das ocorrências do verbo dar em português do Brasil. O objetivo da classificação é indicar uma taxonomia verbal que possa ser expandida e adaptada para a descrição de outros verbos da língua. Com base no modelo teórico-metodológico do Léxico- Gramática (GROSS, 1975, 1981), foram analisados os colocados do verbo dar, em suas mais diversas ocorrências, e essa análise levou a uma classificação sintático-semântica do verbo, a qual prevê as seguintes categorias: verbo pleno, verbo-suporte, verbo causativo, construção gramatical, constituinte de expressão cristalizada e constituinte de provérbio. Todas essas categorias podem ser desmembradas em outras subcategorias que abarcam todas as ocorrências do verbo dar no corpus PLN.Br Full. Palavras-chave: Tipologia verbal; classificação sintático-semântica; verbo dar.Abstract: This paper presents a proposal for classifying the occurrences of the verb dar (give) in Brazilian Portuguese. The classification aims to provide a verbal taxonomy which can be expanded and adapted for describing other verbs of the language. Based on Lexicon-Grammar theory and methodology (GROSS, 1975, 1981), the collocates of verb dar (give) were analyzed, and * Universidade Federal de São Carlos 106 CALIGRAMA, Belo Horizonte, v.18, n.2, p. 105-130, 2013 this analysis led to a syntactic-semantic classification, resulting in the following categories: plain verb, support verb, causative verb, grammatical construction, idiomatic expression constituent and proverb constituent. All these categories can be redefined into subcategories relative to all other occurrences of the verb dar (give) in PLN.Br Full corpus. Keywords: Verbal typology; syntactic-semantic classification; verb dar (give).</p

    AN ANNOTATED CORPUS WITH SUPPORT VERB CONSTRUCTIONS IN PORTUGUESE

    No full text
    The support verb constructions (SVC) are a type of nominal construction, where the core predicate is the noun, called 'predicative noun' (Npred), which is assisted by a verb, called 'support verb' (Vsup). The Lexicon‑Grammar theoretical and methodological framework was adopted, in this paper, for the linguistic description and formalization of SVC in Portuguese. Considering the syntactic and semantic differences between SVC and other types of constructions, the purpose of this paper is to present the methodology and results of creating a corpus annotated with Vsup and Npred. A list with 4,668 SVC was built, considering 45 variants of Vsup and around 3,200 different Npred. Based on this list, we extracted 121,198 sentences from PLN.Br full corpus, from which 2,646 sentences have been manually annotated. This sample may constitute a reference corpus for the processing of SVC and used as a golden standard for evaluating the automatic tasks of identification, extraction or classification of SVC, as well as for other Natural Language Processing (NLP) applications
    corecore